طراحی سامانه ای برای شناسایی جملات مشابه برای استفاده در خلاصه سازی چند سنده

پایان نامه
چکیده

با افزایش روزافزون اطلاعات و حجم بالای مطالب موجود در فضای مجازی دیگر تکنیک های بازیابی اطلاعات جوابگوی نیاز کاربران نمی باشد. لزوم استفاده از روش هایی که بتواند خلاصه ای از اطلاعات مفید را در اختیار کاربران قرار دهد افزایش می یابد. خلاصه ساز چند سنده از جمله سیستم هایی می باشد که با ورود چند سند با موضوع یکسان به عنوان ورودی خلاصه ای از مهمترین اطلاعات مورد نظر را در اختیار کاربر قرار می دهد. افزونگی اطلاعات یکی از چالش های مهم در خلاصه سازی چند سنده می باشد. منظور از افزونگی اطلاعات تکرار مفاهیم یکسان در موضوع مشخص می باشد. با این توضیح که با افزونگی اطلاعات فرصت قرارگیری جملات مفید در خلاصه با توجه به حجم محدود آن از دست می رود. لذا لزوم دستیابی به سیستم شباهت یابی که بتواند از تکرار جملات مشابه در خلاصه جلوگیری کند افزایش می یابد. روش شباهت یابی پیشنهادی در این پایان نامه که برای زبان فارسی طراحی گردیده بر پایه معنا و نحو می باشد که بعد از پیش پردازش و ریشه یابی و استخراج کلمات صورت می گیرد. در روش شباهت یابی بر پایه معنا از یک بردار یکتا که از کلمات دو جمله تشکیل شده بهره می بریم. سپس با استفاده از فارس نت که شامل کلمات، مترادفات و روابط موجود بین مترادفات کلمات می باشد برای دستیابی به شباهت دو کلمه و کامل کردن درایه های بردار یکتا برای هر جمله استفاده می کنیم. همچنین در روش شباهت یابی بر پایه معنا از برچسب گذار ادات سخن برای ارزش گذاری به نقش های مختلف کلمات (اسم، فعل و صفت) بهره می بریم. در روش شباهت یابی بر پایه نحو از ترتیب کلمات بهره برده ایم که به جایگاه قرارگیری کلمات با توجه به شباهت معنایی بین آن ها در جمله توجه می نماید. در نهایت با ضریبی که به شباهت معنا و نحو با توجه به اهمیت آن ها اختصاص داده می شود شباهت دو جمله محاسبه می گردد. برای ارزیابی سیستم شباهت یاب از یک خلاصه ساز چند سنده بهره برده ایم. در این سیستم خلاصه ساز، از روش خوشه بندی average link و گزینشگری استفاده نموده ایم که شبیه ترین جمله در هر خوشه را انتخاب می کند. با بررسی آزمایش های به دست آمده و مقایسه روش پیشنهادی با روش شباهت یابی که در سیستم mead استفاده شده بود با بهبود 7 درصدی در کاهش افزونگی مواجه شدیم.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

طراحی و شبیه سازی یک ترانزیستور SOI-MOSFET چند لایه‏ ای برای بهبود اثرات خود گرمائی

این مقاله طرح جدیدی برای ساختار ترانزیستورهایSOI-MOSFET به عنوان راهکاری مناسب برای کاهش اثرات مخرب پدیده خودگرمایی ارائه می دهد. ایده اصلی در ارائه این ساختار نوین٬ استفاده ازماده Si3N4 می باشد که دارای هدایت گرمائی بالاتری نسبت به اکسید سیلیسیم است. همچنین به کمک شبیه سازی دو بعدی٬ عملکرد این ساختار مورد تجزیه و تحلیل قرار گرفته است. نتایج بدست آمده نشان می دهند که ساختار SOI-MOSFET چند لای...

متن کامل

شناسایی شاخص‌های اثرگذار در طراحی سامانه موبایل موک برای آموزش مجازی کارکنان: یک مطالعه کیفی

هدف پژوهش حاضر شناسایی شاخص‌های اثزگذار طراحی سامانه موبایل موک جهت آموزش مجازی کارکنان بود. از پایگاه ­های علمی پروکوییست، گوگل اِسکالِر، ساینِس دایرکت، ِامرالد ، ِاسکوپوس و ِاسپرینگر تعداد 28 مقاله انتخاب شد و  با روش مقایسه مستمر  و تحلیل محتوای کیفی  به منظور استخراج نظامند یافته‌های متون پیشین تحلیل شدند. از درون متن مقالات و از طریق فرایند کدگذاری باز، کدگذاری محوری و کدگذاری انتخابی 27 مفهوم و...

متن کامل

ایجاد سامانه ای برای بررسی دقت روش lsa در خلاصه سازی متون زبان فارسی

در این پایان نامه خلاصه سازی استخراجی متون زبان فارسی مورد توجه قرار گرفته است. با توجه به شیوه های معمول امتیازدهی برای خلاصه سازی، در این پایان نامه سعی بر این است که شیوه lsa را که کمتر در زبان فارسی به آن پرداخته شده است، به کار گرفته شود و نتایج به دست آمده آن ارزیابی گردد. در شیوه lsa با استفاده از ماتریس تکرار واژه ها متن سعی بر این است که ساختارهای مخفی در متن شناخته شود. آزمایش های ا...

15 صفحه اول

خلاصه سازی چکیده ای مبتنی بر مشابهت جملات

خلاصه سازی خودکار متون همزمان با رشد روز افزون اسناد و طلاعات بیش از پیش مورد توجه علاقه مندان حوزه پردازش زبان طبیعی قرار گرفته است. از این میان خلاصه سازی چند سنده که در آن چندین سند به عنوان ورودی دریافت می گردد، مورد توجه زیادی قرار گرفته است. در بسیاری از روش های تنها گزیده ای از جملات اولیه بدون تغییر به عنوان خلاصه برگردانده می شود. که به خلاصه سازی گزینشی معروف است. در مقابل آن در زمینه...

15 صفحه اول

طراحی بهینه جانمایی برای اجزای یک سامانه کنترلی فضایی با استفاده از روش بهینه سازی گرادیانی

چکیده این مقاله بر روی مدل سازی جانمایی اجزا و بهینه سازی آن متمرکز می باشد. یک سامانه کنترلی فضایی به عنوان نمونه مطالعاتی انتخاب شده است. اکثر کارهای تحقیقاتی انجام شده در این حوزه، المان های طراحی را به صورت اجزای ثابت در طول زمان در نظر گرفته اند. در این مقاله رویکرد جدیدی بر مبنای جرم متغیر اجزا مطرح شده است که در آن تابع هدف کمینه کردن دامنه تغییرات مرکز جرم در مدت کارکرد سامانه می باشد. ...

متن کامل

طراحی و شبیه سازی یک ترانزیستور soi-mosfet چند لایه‏ ای برای بهبود اثرات خود گرمائی

این مقاله طرح جدیدی برای ساختار ترانزیستورهایsoi-mosfet به عنوان راهکاری مناسب برای کاهش اثرات مخرب پدیده خودگرمایی ارائه می دهد. ایده اصلی در ارائه این ساختار نوین٬ استفاده ازماده si3n4 می باشد که دارای هدایت گرمائی بالاتری نسبت به اکسید سیلیسیم است. همچنین به کمک شبیه سازی دو بعدی٬ عملکرد این ساختار مورد تجزیه و تحلیل قرار گرفته است. نتایج بدست آمده نشان می دهند که ساختار soi-mosfet چند لایه ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - موسسه آموزش عالی غیر انتفاعی و غیر دولتی نبی اکرم - دانشکده فنی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023